home *** CD-ROM | disk | FTP | other *** search
/ Aminet 31 / Aminet 31 (1999)(Schatztruhe)[!][Jun 1999].iso / Aminet / comm / tcp / GetAllHTML.readme < prev    next >
Encoding:
Text File  |  1999-05-02  |  3.0 KB  |  70 lines

  1. Short:    Auto-download/check entire web sites! (v0.64 )
  2. Author:   Chris.S.Handley@BTInternet.com
  3. Uploader: Chris.S.Handley@BTInternet.com
  4. Version:  v0.64ß
  5. Type:     comm/tcp
  6. Requires: HTTPResume v1.3+, Rexxsupport.library, ARexx
  7.  
  8. Introduction
  9. ------------
  10. Have you ever visited a cool web site & wanted to keep a copy of some/all of it,
  11. but it would takes ages to find & download all the respective pages/files?
  12.  
  13. This is the answer!
  14.  
  15. You supply this ARexx script with the start page URL, and a destination
  16. directory (which should be empty), and maybe a few other options - and off it
  17. goes!  Note that it needs HTTPResume v1.3+ to work (get from Aminet).
  18.  
  19. Latest News
  20. -----------
  21. A fix I did in v0.61 was actually wrong - undone so that all downloading should
  22. work properly now.  Also improved BROKENLINKS & other minor things.  I actually
  23. had time to test this release, so it should work pretty well! :-)
  24.  
  25. Many people have been having problems with GetAllHTML after editing it - seems
  26. this is due to spurious ASCII-27 characters mucking-up some editors :-( .
  27. Anyway, I wrote a program to detect & remove all non-visible characters
  28. (available if wanted), and it seems that GetAllHTML is the only recent text file
  29. I wrote which had the problem...  Any ideas WHY they appeared?  I use CygnusEd
  30. v3.5.
  31.  
  32. I've programmed the BROKENLINKS switch to allow web page makers to automagically
  33. search their site for broken links - written just for Alexander Niven-Jenkins
  34. (emailing me can be worth it;-)
  35.  
  36. Changed the NOPAUSE switch to PAUSE, so that it defaults to NOT pausing.
  37.  
  38. Very minor enhancments & fixed an arguments interpreting bug.
  39.  
  40. I will still fix major bugs until I have an AmigaE version that can be tested.
  41.  
  42. History
  43. -------
  44. v0.64ß (04-04-99) - Put back the 'extra' END that I removed in v0.61 .  Now
  45.             BROKENLINKS will always only try to download external links
  46.             once.  Removed NOENV argument of HTTPResume so proxy
  47.             settings may work.  Minor changes.
  48. v0.63ß (04-04-99) - Removed spurious non-visible ASCII (27) characters that
  49.            caused some text editors to go loopy.
  50. v0.62ß (03-04-99) - Add the BROKENLINKS switch.  Replaced NOPAUSE by PAUSE
  51.            switch.  Now always warns if a file could not be downloaded
  52.            (not just pages).  If you used all the arguments then it
  53.            would miss the last one.
  54. v0.61ß (28-03-99) - Possible fix for RESUME problem done, plus stupidly left an
  55.            extra END where it broke GetAllHTML.
  56. <snip>
  57.  
  58.  
  59. ============================= Archive contents =============================
  60.  
  61. Original  Packed Ratio    Date     Time    Name
  62. -------- ------- ----- --------- --------  -------------
  63.    15752    7130 54.7% 04-Apr-99 19:09:54  GetAllHTML.doc
  64.     1499     422 71.8% 27-Mar-99 23:39:22  GetAllHTML.doc.info
  65.     2446    1310 46.4% 04-Apr-99 19:12:12  GetAllHTML.readme
  66.    20801    6332 69.5% 04-Apr-99 19:13:46  GetAllHTML.rexx
  67.      654     373 42.9% 03-Apr-99 16:44:44  GetAllHTML_ex.script
  68. -------- ------- ----- --------- --------
  69.    41152   15567 62.1% 05-Apr-99 21:47:44   5 files
  70.